Z检验与单比例的置信区间
作者:Ruben Geert van den Berg,出自统计学A-Z
- Z检验的假设
- 单比例Z检验 - 公式
- Z检验的连续性校正
- 单比例的置信区间
- Agresti-Coull调整的置信区间
单比例的Z检验用于检验某个总体比例是否可能为 x。例如:某个总体中是否有0.60(或60%)的人口携带Covid-19的抗体?
如果这是真的,那么样本比例可能与0.60略有不同。但是,如果样本比例与0.60 非常 不同,则表明我们最初的假设是错误的。
请注意,此零假设意味着一个二分变量:只有两种可能的结果,携带或 不 携带此类抗体。
单比例Z检验 - 示例
- 一位流行病学家认为,60%的荷兰成年人携带Covid-19的抗体;
- 她抽取了N = 112人的样本,并对他们进行了PCR检测;
- 112人中有58人(51.8%)的检测结果为阳性,因此携带抗体。
鉴于这一结果,她是否仍然认为整个总体中有60%的人携带抗体?Z检验可以回答这个问题,但它需要一些假设。
Z检验的假设
单比例的Z检验需要两个假设:
- 观测值之间相互独立;
- \(n_1 \) 且 \(n_2 \):我们的样本对于每一种可能的结果,都应该包含至少15个观测值。
标准的教科书 3, 5 通常建议 \(n_1 \) 且 \(n_2 \),但最近的研究表明,这些样本量不足以获得准确的检验结果。2
单比例Z检验 - 公式
如果样本量足够大,则样本比例近似服从正态分布,其参数为
\[\mu_0 = \pi_0\] 且
\[\sigma_0 = SE_0 = \sqrt{\frac{\pi_0(1 - \pi_0)}{N}}\]
其中
- \(_0\) 表示零假设下的总体比例;
- \(SE_0\) 表示零假设下的标准误差(Standard Error);
- \(N\) 表示总样本量。
我们的例子是检验总体比例 \(_0\) 是否为0.60,总样本量 \(N\) = 112,因此,
\[SE_0 = \sqrt{\frac{0.60(1 - 0.60)}{112}} = 0.046.\]
利用这个结果,我们可以将样本比例 \(pi\) 标准化为Z分数(Z-score),公式如下:
\[Z = \frac{pi - \pi_0}{SE_0}\]
我们的样本得到的比例 \(pi\) 为0.52,因为112人中有58人携带Covid-19抗体。因此,
\[Z = \frac{0.52 - 0.60}{0.046} = -1.77\]
最后,
\[p(2{\text -}tailed) = 2 \cdot p(z \lt -1.77) = 0.076.\]
这意味着,如果总体比例确实为0.60,那么在任一方向上发现样本比例为0.52或更极端的结果的概率为0.076(或7.6%)。结论:如果我们以通常的 \(\) = 0.05水平进行检验,我们 不 拒绝 \(_0 = 0.60\) 的零假设。所有公式都可以在此Google表格中找到(只读),部分内容如下所示。
Z检验的连续性校正(Continuity Correction)
我们刚才讨论的Z检验得出了一个 近似的 显著性水平。可以通过一个简单的调整来提高此结果的准确性:
\[pi_{cc} = \begin{cases} \frac{N \cdot pi \;- \;0.5}{N} \;\;\text{ if } \;\;pi \gt \pi_0\\\\\\\ \frac{N \cdot pi \;+ \;0.5}{N} \;\;\text{ if } \;\;pi \lt \pi_0 \end{cases}\]
此连续性校正只是在将成功的数量转换为样本比例之前,从中加上或减去0.5。
对于我们的示例,我们测试:
\[pi_{cc} = \frac{112 \cdot 0.52 + 0.5}{N} = 0.522\]
现在,我们仍然基于 \(pi\) 计算 \(SE_0\),但我们计算 \(Z\) 为
\[Z_{cc} = \frac{pi_{cc} - \pi_0}{SE_0} \approx -1.68 \]
进行连续性校正的原因是成功的数量严格遵循二项分布。此离散分布给出了每个单独结果的精确概率。
当用概率密度函数(例如正态分布)近似这些概率时,我们需要包括 整个 结果。如下例所示,这从(结果 - 0.5)到(结果 + 0.5)变化。
最后,下面的屏幕截图显示了(未)校正的Z检验的SPSS输出。
“Test Value” 指的是 \(_0\),即假设的总体比例;
“Observed Test Value” 指的是 \(pi - _0\);
SPSS 报告了此检验的 错误的 标准误差;
Z值和p值证实了我们的计算。
单比例的置信区间(Confidence Interval)
计算比例的置信区间 使用与相应的Z检验不同的标准误差:
\[SE_a = \sqrt{\frac{pi(1 - pi)}{N}}\]
请注意,标准误差现在使用我们的样本比例 \(pi\) 而不是假设的总体比例 \(_0\)。我们的 \(N\) = 112 的样本得出的比例为 0.52,因此
\[SE_a = \sqrt{\frac{0.52(1 - 0.52)}{112}} = 0.047.\]
我们现在可以构建总体比例 \(\) 的置信区间,公式为:
\[CI_{\pi} = pi - SE_a \cdot Z_{1-^{\alpha}_2} \lt \pi \lt pi + SE_a \cdot Z_{1-^{\alpha}_2}\]
对于 95% 置信区间,\(\) = 0.05。因此,
\[Z_{1-^{\alpha}_2} = Z_{.975} \approx 1.96\]
这导致:
\[CI_{\pi} = 0.52 - 0.047 \cdot 1.96 \lt \pi \lt 0.52 + 0.047 \cdot 1.96 = \]
\[CI_{\pi} = 0.43 \lt \pi \lt 0.61\]
这意味着区间 [0.43, 0.61] 有 95% 的可能性包含携带 Covid-19 抗体的人的总体比例。
下面的屏幕截图显示了如何在此Google表格中计算此置信区间。
Agresti-Coull调整的置信区间
我们之前提出,上述置信区间要求 \(n_1 \) 且 \(n_2 \)。Agresti & Coull (1998) 1 提出了一个简单的调整,当不满足此假设时:
- \(n_{1ac} = n_1 + 2\) 且
- \(n_{2ac} = n_2 + 2\)。
也就是说,我们只需向每个组添加 2 个观测值,然后照常进行。作者提出的示例涉及一个包含以下内容的样本:
- \(n_1\) = 0 名拥有 iPod 的受访者
- \(n_2\) = 20 名不拥有 iPod 的受访者
在向每个组添加 2 个观测值后,我们只需计算以下内容的置信区间:
- \(n_1\) = 22 名不拥有 iPod 的受访者
- \(n_2\) = 2 名拥有 iPod 的受访者
这最初导致
\[CI_{\pi} = \frac{22}{24} - 0.056 \cdot 1.96 \lt \pi \lt \frac{22}{24} + 0.056 \cdot 1.96 = \]
\[CI_{\pi} = 0.807 \lt \pi \lt 1.027\]
但是,由于比例不能大于 1,我们将此区间截断为 [0.807, 1.000]。
下面的屏幕截图显示了我们的 Covid-19 示例的(未)调整的置信区间的SPSS输出。
与其他检验的关系
首先, 没有 连续性校正的单比例Z检验等同于卡方拟合优度检验:这些检验总是产生相同的p值(p-value)。
其次, 有 连续性校正的单比例Z检验非常接近二项检验:对于我们的 Covid-19 示例,
- 连续性校正的Z检验的p(2-tailed) = .093;
- 二项检验的 2 · p(1-tailed) = .095。
请注意,二项检验为某个样本比例产生一个 精确的 p值。但是,不使用它的一些原因是
- 除非 \(\) = 0.50,否则它只产生单尾p值;
- 它不产生任何置信区间;
- 对于较大的样本量,它的计算量很大。
参考文献
- Agresti, A. & Coull, B.A. (1998). Approximate Is Better than “Exact” for Interval Estimation of Binomial Proportions The American Statistician, 52(2), 119-126.
- Agresti, A. & Franklin, C. (2014). Statistics. The Art & Science of Learning from Data. Essex: Pearson Education Limited.
- Van den Brink, W.P. & Koele, P. (1998). Statistiek, deel 2 [Statistics, part 2]. Amsterdam: Boom.
- Van den Brink, W.P. & Koele, P. (2002). Statistiek, deel 3 [Statistics, part 3]. Amsterdam: Boom.
- Twisk, J.W.R. (2016). Inleiding in de Toegepaste Biostatistiek [Introduction to Applied Biostatistics]. Houten: Bohn Stafleu van Loghum.